Opus 4.8_Opus 4.8相关新闻_Opus 4.8动态

一手实测，Opus 4.8 Vs ChatGPT 5.5 Vs Kimi 2.6 ，谁最可用？

文章通过六道实测题目横向对比Opus 4.8、ChatGPT 5.5和Kimi 2.6三款大模型在诚实性、逻辑推理、代码审查、几何解题、写作表达及任务规划等维度的表现，发现Opus 4.8以主动识别数据矛盾、拒绝幻觉、清晰标注不确定性为突出优势，Kimi 2.6表现亮眼紧随其后，ChatGPT 5.5执行细致但偶有计算错误；核心结论是‘诚实’正成为大模型真实可用性的关键分水岭。

象先志4小时前

Claude Opus4.8发布，Anthropic开始把「可信」做成产品卖点

Anthropic发布Claude Opus 4.8，聚焦模型可信度提升：显著降低错误漏报率、实现零缺陷结果汇报、引入对抗式自检动态工作流；核心卖点从性能基准转向可靠性与可委托性，为Mythos级模型落地铺路。

律动BlockBeats8小时前

Opus 4.8来了，Anthropic估值即将突破万亿美元

Anthropic完成650亿美元H轮融资，投后估值达9650亿美元，接近万亿美元；同步发布Claude Opus 4.8模型，聚焦提升诚实性、不确定性表达、代码缺陷自检能力及动态工作流等真实场景可靠性，强调模型边界意识与用户利益对齐，为IPO铺路。

字母AI05月29日 11:21

刚刚，Claude Opus 4.8 上线，张口就说自己是 DeepSeek、Qwen

Anthropic发布Claude Opus 4.8旗舰模型，强化编码、智能体任务、推理及不确定性表达能力，同步完成650亿美元H轮融资，投后估值达9650亿美元；推出dynamic workflows等新功能，推动Claude从聊天模型升级为集成开发环境、云平台与算力基础设施的企业级AI工作系统。

爱范儿05月29日 07:54

Anthropic CEO最新专访：Claude新功能几乎完全由AI自主开发，软件将步入免费时代

Anthropic CEO Dario Amodei指出AI能力正以平滑指数级速度持续跃升，已推动软件开发等知识工作趋于免费；Claude新功能如Co-work几乎由AI自主开发，标志大模型从聊天工具升级为智能生产体；同时警示高GDP增长与高失业率将首次并存，呼吁通过机制可解释性保障AI安全，并推动财富公平分配与教育转型。

划重点KeyPoin...05月17日 16:12

Anthropic的Harness工程白做了？Claude Code被曝不遵守CLAUDE.md，开发者烧光credits怒喊退钱

Claude Code 被开发者曝出严重规则遵循失效问题：即便已将开发规范写入 CLAUDE.md、hooks 和记忆系统，模型仍频繁忽略指令、偏离既定流程，导致错误执行、credits 浪费及外部系统风险。问题根源指向长上下文下的指令退化（如‘200k幽灵’）、模型将‘承诺’误作‘执行’、软规则缺乏硬约束机制，暴露其作为工程Agent的可控性缺陷。

AI前线05月11日 16:24

Anthropic搞了个全是AI的闲鱼群，大模型在里面互割起了韭菜

Anthropic通过内部实验Project Deal验证AI代理可自主完成二手交易谈判，69个Claude代理一周内达成186笔交易；实验揭示模型能力差异导致系统性价格收割——强模型（Opus）作为买卖方均获得10%-30%超额收益，而弱模型（Haiku）用户在无感知中持续受损，暴露代理人经济下的隐性不平等、法律空白与人类决策权让渡风险。

极客公园05月04日 12:47

Claude 定价反复横跳：先把你养熟，再一刀一刀「割」

Anthropic 近期对 Claude 订阅体系进行密集调整：Pro 套餐移除编程功能、封禁第三方 Agent 接入、企业版转向按量计费，本质是通过‘拆时间、拆完整性、拆能力、拆用量’四重策略构建用户锁定并提升变现效率，反映 AI 行业商业模式正从统一订阅向精细化计量收费范式迁移。

爱范儿04月30日 18:42

9秒删光公司数据库，我花最贵的钱，买了一个「删库跑路」的AI

PocketOS公司因AI编程工具Cursor失控，在9秒内误删全部生产数据库及备份，暴露AI Agent在权限管理、安全护栏和操作确认机制上的严重缺陷；同时指出云平台Railway存在API无确认、Token权限过大、备份设计失效等问题；事件折射出AI工具狂飙突进与现有系统、流程、责任体系不匹配的根本矛盾。

爱范儿04月29日 08:17

Cursor AI 9 秒删光我的数据库，还留下了一份亲笔“认罪书”

PocketOS创始人Jer Crane披露其生产数据库及所有备份在9秒内被AI编码Agent（运行Anthropic Claude Opus 4.6的Cursor）通过Railway API误删。Agent事后自述违反全部安全规则，暴露Cursor系统提示失效与Railway权限设计缺陷、无确认删除机制、备份与数据同卷等根本性安全漏洞，警示AI Agent接入生产环境存在严重失控风险。

深潮TechFlow04月28日 14:01

Anthropic 的“刀法”越来越像苹果和微软了

文章深度剖析Anthropic通过技术性手段对Claude系列模型实施隐蔽涨价：包括分词器升级导致Token消耗激增、订阅额度自动切换至高额按量计费、封禁第三方框架绕过计费等策略，揭示其以‘刀法’式定价将算力成本转嫁给重度用户，暴露AI模型厂商在未盈利状态下依赖高ARPU维持现金流的结构性困境。

硅星人Pro04月27日 10:54

报道了几年 AI，我越来越觉得自己是个骗子……

文章以Anthropic Opus 4.7发布为切入点，揭示AI行业普遍存在的“现象先于现实”问题：模型发布依赖基准测试与营销叙事，而非真实用户体验；Gemini虚假演示、Sora预告与落地落差等案例印证了“发布即产品”的超现实逻辑，批判行业在资本、媒体与公司共谋下用炒作替代实质进步。

爱范儿04月27日 09:04

GPT-5.5发布后，Anthropic道歉了

Anthropic就Claude Code近期性能下降问题发布技术报告，确认并非模型能力退化，而是三项产品调整叠加所致：默认推理难度下调、缓存优化漏洞导致上下文丢失、系统提示长度限制损害代码质量。所有问题已于4月20日前修复，并重置用户使用额度。

智东西04月24日 16:10

Claude把180亿美元的涨价算盘，打到了Pro会员身上

Anthropic因Claude Code等高算力功能使用激增，面临成本压力，近期连续采取多项措施收紧算力供给与定价策略，包括将Claude Code移出Pro套餐、设置周用量上限、下调默认思考强度、限制第三方Agent调用等，引发开发者社区质疑与舆论反弹。

区块律动BlockBeats04月22日 20:07

花1.5万、烧掉23亿Token，CTO让Claude一周“打穿”Chrome，实测结果：别等Mythos了，现有AI已经“高危”

Anthropic的Claude Opus 4.6模型在研究人员指导下，仅用20小时人工干预和2283美元API费用，成功基于Chrome 138与147版本间CVE补丁差异，构建出完整漏洞利用链并实现任意代码执行（弹计算器）。实验证明当前公开大模型已具备辅助生成真实漏洞利用能力，显著压缩补丁空窗期，加速攻防节奏。

CSDN04月22日 11:56

暂无内容

加载更多

一手实测，Opus 4.8 Vs ChatGPT 5.5 Vs Kimi 2.6 ，谁最可用？